- Дипломы
- Курсовые
- Рефераты
- Отчеты по практике
- Диссертации
Измерение отношения
Среди психологических переменных отношение – одна из наиболее важных. Она помогает разобраться в моделях поведения. В маркетинге исследуется не только отношение покупателей к товару, но и отношение работников к своей работе, посредников (дилеров) к гарантийной политике фирмы. Отношение покупателя прямо влияет на решение о покупке. В свою очередь, покупка влияет на отношение через опыт использования купленных товаров. Решение о покупке почти однозначно определяется отношением на момент покупки; от удовлетворенности работников зависят результаты их деятельности; от отношения дилеров к фирме – успех этой фирмы. Если отношение покупателей к товару плохое, то следует изменить маркетинговую политику. Отношение можно изменить, сформировать, хотя для этого иногда требуются значительные усилия. Несмотря на то, что отношение – широко используемое понятие, единого мнения о том, что же это такое, нет. Вот варианты определения отношения. ? Предрасположение к принятию (приятию) объекта; не поведение, а категория готовности. ? Скрытое качество, которое вызывает последующие высказывания или реальные действия. ? Направленность на объект: предпочтения, оценки, чувства. При выборе шкалы измерений следует обратиться к свойствам измеряемых атрибутов. Нельзя использовать интервальную или относительную шкалу, если атрибут порядковый по сути. (Как себе представить абсолютный ноль отношения к демократам?). Отношение бывает нейтральным, но это не отсутствие отношения! Иногда вид шкалы определяется процессом измерений: если требуется ранжировать 5 объектов по уровню предпочтения, то получается порядковая шкала (пример – рейтинг самых популярных людей года). В маркетинговых исследованиях есть опасность задаться слишком «точной» шкалой, тогда статистическая обработка будет сложной, «красивой», но бессмысленной. Методы измерения отношения Для измерения отношения существует несколько путей. Это самоотчеты , наблюдение за поведением, выполнение объектной задачи , измерение психологических реакций или непрямые методы. Самоотчет наиболее распространен. В нем респондента явно спрашивают о его отношении к объекту, деятельности, классу объектов. Правда, при использовании таких методов требуется прояснить, что в результатах обусловлено отношением, а что – методом. Как отмечалось в разделе «Виды опросов», вопросы не всегда можно задавать «в лоб». Наблюдение поведения используется в предположении, что поведение определяется отношением. Иногда создается искусственная ситуация (например, на улице просят подписать «сильное» заявление против загрязнения окружающей среды ). В других случаях наблюдатель смешивается с группой обсуждающих некоторую проблему. Объектная задача. Здесь требуется, например, запомнить факты о загрязнении окружающей среды, мерах по очистке. Люди, озабоченные состоянием вопроса, будут справляться с задачей лучше. Измерения психологических реакций. Это измерения с помощью гальванометра или других средств, о которых говорилось ранее. Методы дают интенсивность эмоций, но не их знак. Непрямые методы включают ассоциации слов, завершение предложений. Шкалы отношения для самоотчетов Шкала равных интервалов Турстоуна и Чейва Пример: требуется определить отношение к различным банкам и сравнить их. Один банк может быть удобно расположен, но отличаться невежливым обслуживанием, другой имеет удобные часы работы, но высокую плату за услуги и т. п. Требуется как-то обобщить все эти характеристики. Для этого разрабатывается соответствующий инструмент исследования – анкета. Процесс проектирования анкеты для данного случая заключается в том, что разрабатывается ряд вопросов, из которых затем выбираются лучшие. В результате анкета должна стать небольшой и в то же время хорошо определяющей отношение к заданному классу исследуемых элементов. Для отбора «хороших» вопросов лучше всего использовать не их анализ разработчиком и даже не разбор анкеты фокусной группой, а опрос, проводимый среди респондентов, близких по характеристикам с теми, отношение которых предполагается определить. По результатам этого предварительного опроса и проводится отбор наиболее удачных вопросов. Шаг 1. Определяется класс объектов, отношение к которым требуется измерить. Для данного примера это отделения банков, ведущие расчеты с физическими лицами. Если, например, исследуется отношение к моделям автомобилей, то важно определить, исследуется ли марка в целом или конкретные модели автомобиля. Если выбраны конкретные модели, то важно определит, к какому типу они относятся. Например, фирма Mercedes Benz выпускает различные автомобили, от легковых до тяжелых грузовиков. Очевидно, для различных типов автомобилей будет опрашиваться различная аудитория, и сами вопросы будут также различными. Важно также принять во внимание цель опроса и предполагаемую аудиторию. Вопросы будут различны для анкетирования лиц, приобретающих легковой автомобиль в личное пользование, и для руководителей таксопарков. Шаг 2. Разрабатывается множество утверждений относительно элементов исследования (например, моделей автомобилей). Они редактируются, чтобы убрать неудачные, двусмысленные, самоочевидные и не выражающие мнений. Примеры допустимых утверждений: Автомобиль экономичен . Автомобиль комфортен для пассажиров. Автомобиль легко управляем. Всего обычно выбирается 100 – 200 высказываний . Шаг 3. Большое количество судей или экспертов (это количество определяется статистической достоверностью результата и обычно находится в пределах 30…100) сортируют собранные высказывания по уровню их положительности для элементов исследования на 11 категорий, от самой отрицательной до самой положительной. Им задается вопрос: Как Вы считаете, насколько положительно характеризует АВТОМОБИЛЬ ВООБЩЕ (не конкретный!) каждое из приведенных утверждений (0 – очень отрицательно, 6 – безразлично, 11 – очень положительно). В «классическом» варианте все высказывания заносятся на карточки и эти карточки располагаются судьями по клеткам, соответствующим их оценкам (от очень отрицательной до очень положительной). Принимается допущение, что судьи используют при этом интервальную шкалу, то есть разница между клеткой 1 и клеткой 2 такая же, как между клетками 2 и 3 и т.д. Отсюда и название всей шкалы. Допускается и проставление соответствующей цифры против каждого из высказываний. Однако обязательным требованием является использование отдельных анкет для каждого судьи, так как иначе будет сказываться влияние предыдущих ответов (всегда есть соблазн не очень задумываясь ответить как другие) . Судей следует выбирать из той же категории людей, которая будет опрашиваться. Впрочем, задачи судей и респондентов все же несколько различны, что может внести некоторую ошибку. Шаг 4. Для каждого высказывания определяется среднее и дисперсия ответов по каждому вопросу. (Для упрощения процедуры могут использоваться соответственно медиана и интерквартильная широта) . Шаг 5. Выбирается порядка 20 высказываний с различным значением среднего (медианы). Лучше всего, если эти значения будут расположены от 1 до 11 с равным шагом. Для этого высказывания должны быть априорно положительными и отрицательными, например: Комфортность для пассажиров. Недостаточная маневренность. «Хорошие» высказывания должны иметь малый разброс в их оценках различными судьями. Если разброс велик, то высказывание двусмысленно: одни будут считать его положительным свойством, другие – отрицательным. Таким образом, среди высказываний с близкими значениями среднего следует выбрать те, у которых разброс ответов минимален или близок к минимальному. Шаг 6 (использование шкалы). Выбранные высказывания записываются на карточки. Карточки перемешиваются и предъявляются респондентам. У каждого респондента спрашивают, согласен ли он с данным высказыванием применительно к конкретному объекту (например, определенной модели автомобиля). Возможные ответы: да и нет. Шаг 7 (анализ данных). Далее подсчитывается общее отношение респондента по всем его ответам на отобранные вопросы. Если опрашиваемый согласен с высказываниями, имеющими средние значения 4, 6 , 8, то его общее отношение, определяемое как среднее по ответам, будет равно 6 (близкое к нейтральному) . Обсуждение. Анкету трудно проектировать, но она легка для ответов и в обработке, применима ко всем элементам исследования заданного класса. Недостатком метода является то, что два человека могут согласиться с совершенно разными высказываниями, но иметь одинаковый средний результат. Кроме того, не учитывается степень согласия. Может быть, для кого-то единственно важный критерий – удобные часы работы, а все остальные в принципе безразличны, а для кого-то важен целый набор показателей. Кроме того, проблема возникает в том случае, если кто-то не согласен ни с одним утверждением: тогда анкета просто «не срабатывает». Если же он согласен только с одним или малым числом утверждений, то достоверность такого ответа будет низкой. Разработанная анкета может быть использована для сравнения отношения к различным объектам, для определения различий в отношении к одному объекту среди респондентов, а также для выявления причин плохого или хорошего отношения. Шкала суммированного рейтинга Ликерта Цели построения данной шкалы и ее использование сходны с предыдущим случаем, но метод разработки несколько отличается. Шаг 1 аналогичен первому шагу при разработке шкалы Турстоуна. Шаг 2. Разрабатывается множество (порядка 100 – 200) исходных утверждений аналогично предыдущему случаю. Утверждения априорно разбиваются на положительные и отрицательные. Здесь полезно представить себе, как прореагирует на данное утверждение человек, относящийся к некоторому банку, кафе, магазину очень положительно, и как прореагирует самый большой скептик. Если их реакция будет (или может оказаться) одинаковой, то это утверждение неудачно . Шаг 3. Около 200 опрашиваемых проставляют свое мнение о данном высказывании применительно к конкретному элементу исследования. Их возможные ответы разделяются на 5 категорий: полностью не согласен, не согласен, безразлично, согласен, полностью согласен. Кодировка ответов может производиться числами от -2 до 2 или от 1 до 5. Этот опрос аналогичен использованию готовой анкеты, за исключением того, что в нее входят как хорошие, так и неудачные вопросы. Поэтому проектирование данной шкалы проще, чем для предыдущего случая. Кроме того, результаты предварительного анкетирования могут быть включены в общие результаты исследования, если взять из них только ответы на отобранные «хорошие» вопросы. Шаг 4. Ответы преобразуются. Это преобразование базируется на допущении, что при хорошем отношении респондент будет согласен с положительными высказываниями и не согласен с отрицательными. Ответы на априорно положительные вопросы оставляются без изменений, а для отрицательных ответ изменяется (в первом случае меняется знак, во втором – 5 заменяется на 1, 4 – на 2, 2 – на 4, 1 – на 5). Цель такого преобразования – добиться того, чтобы сумма баллов по всем ответам была максимальной у хорошо относящихся к элементу исследования и минимальной у плохо относящихся. Шаг 5. Выбираются окончательные высказывания. Надо выбрать такие высказывания, отношение к которым различается не между объектами, а между опрашиваемыми. Именно они и будут характеризовать различие во мнениях . Для этого следует вычислить сумму баллов каждого респондента. Предполагается, что респонденты дают непротиворечивые ответы, то есть те, кто в целом положительно относится к объекту, дадут высокий балл при ответе на большинство положительных вопросов и наоборот. Поэтому сумма баллов будет большой при общей положительной оценке объекта и малой – при отрицательной. Далее предполагается, что, ввиду большого числа вопросов, сумма их ответов для некоторого респондента и есть абсолютная истина и правильно определяет отношение данного человека. Затем вычисляется корреляция между ответами респондентов на каждый вопрос и общими суммами баллов респондентов. Хорошими являются высказывания с высокой корреляцией, то есть дающие ответы, совпадающие с общим мнением. Если же корреляция мала, то вопросы двусмысленны или не выражают мнение. Более простой, ручной способ заключается в следующем. Выбираются две группы респондентов: имеющие минимальную и максимальную сумму баллов. Это те, кто относится к предложенному элементу исследования наиболее отрицательно и наиболее положительно. Обычно в каждую группу выбирается по 25% респондентов. Для каждой группы подсчитывается сумма их ответов на конкретный вопрос. Если эта сумма различается в двух группах, то вопрос считается хорошим, так как хорошо и плохо относящиеся к элементу исследования ответили на него по-разному. Если же разница близка к нулю, то этот вопрос не скажется на различии общего результата и его следует изъять как бесполезный. Итак, выбираются положительные и отрицательные высказывания (всего обычно порядка 20), давшие различные результаты среди «сторонников» и «противников» предложенного элемента исследования. Шаг 6 (использование шкалы). Использование шкалы практически не отличается от процедуры получения данных для ее проектирования. Для получения итогового отношения все ответы суммируются. Ответы на отрицательные высказывания должны быть предварительно преобразованы. Обсуждение. Нельзя сказать, положительным или отрицательным является отношение респондента к предложенному элементу исследования (например, универсальному магазину). Если максимально можно набрать при ответах 100 баллов (при оценке ответов от 1 до 5 баллов), а набрано 80 для элемента A (Гостиный двор) и 70 для элемента B (Пассаж), то можно говорить лишь о том, что отношение к объекту А лучше, чем к В. Однако нельзя сказать, положительны или отрицательны эти отношения. Это объясняется хотя бы тем, что суммы ответов респондентов, наихудшим и наилучшим образом относящихся к некоторому магазину, не обязательно будут равны 0 и 100 соответственно. Один из способов преодоления данного затруднения – определение среднего суммарного отношения к некоторому объекту и предположение, что хорошее отношение есть отношение, которое лучше среднего. Семантическая дифференциальная шкала Идея шкалы – использование биполярных прилагательных, которые, как показали исследования, можно разделить на три некоррелирующие группы: ? оценочные (хороший – плохой, сладкий – горький); ? характеризующие потенциал (мощный – нeмощный, сильный – слабый); ? характеризующие активность (быстрый – медленный, шумный – тихий). Для применения в маркетинговых исследованиях возможны также некоторые модификации: ? не всегда используются антонимы; ? могут использоваться как слова, так и целые фразы, описывающие свойства продукта; ? иногда вместо одного из высказываний в паре используется ничего. Метод применяется для измерения отношения к товарам, маркам, магазинам и пр. Пример: Строится много утверждений о банке: Респондент поставил отметки «Х» для банка A и «О» для банка B. Модификация метода напоминает использование шкалы Ликерта: Далее можно определить среднее или медиану по каждому пункту среди ответов респондентов. Соединив ответы отрезками, можно получить так называемую змеевидную диаграмму (Рис. 23), которая наглядно представляет отношение. Рис. 23. Змеевидная диаграмма отношения к банкам A и B. Из Рис. 23, в частности, видно, что банк В имеет неудачное расположение по сравнению с банком А, что плохо сказывается на отношении к нему. Достоинства метода: ? респондент может показать силу эмоций; ? из змеевидной диаграммы можно почерпнуть больше идей, чем из анализа средних баллов . Непарная шкала Эта шкала имеет ряд отличий от предыдущей. ? Прилагательные или высказывания используются без пар. ? Имеется обычно 10 чисел, характеризующих атрибут. При опросах производится инструктаж: выразите свое мнение о вежливости обслуживания в баллах (-5 – обслуживание крайне невежливое, +5 – самое вежливое). Ноль обычно не включается. Достоинство метода – отсутствие необходимости придумывания пар. Недостаток – довольно сильное влияние фразеологии вопроса на ответ. Ведутся дискуссии о том, считать ли эту шкалу интервальной или порядковой. Поскольку интервальная шкала дает больше возможностей для анализа, многие исследователи склоняются к этому варианту. Другие считают, что использование методов обработки данных, соответствующих интервальной шкале, даст такие данные, которых нет в действительности. Q-сортировка Это – общая методология сбора данных и обработки информации . Она базируется на заранее отобранных высказываниях, которые заносятся на отдельные карточки. Дальнейшее использование сводится к следующим шагам. Шаг 1. Карточки с высказываниями располагаются в зависимости от отношения к реальному объекту или ситуации. Инструкция отвечающему заключается в том, чтобы он положил карточку в определенную ячейку в соответствии с желательностью высказывания для него лично. Обычно предлагается 10 вариантов ответа. Шаг 2. Определяется количество карточек, попавших в каждую категорию. Часто распределение ответов нормально или близко к нормальному. Шаг 3. Определяется ранжирование стимулов индивидами и кластеры индивидов, имеющих одинаковые предпочтения, что может служить основанием для сегментирования. Цель подхода – исследование индивидов, а не объектов. Шкалы рейтинга Типы шкал рейтинга Большинство предыдущих методов не могли ответить на вопрос об относительной важности того или иного параметра. В Табл. 6.1. даны сведения об относительной важности факторов при покупке (на основе [23]). Если дать список этих факторов, то респонденты ответят, что все они важны, хотя на самом деле их важность различна для различных людей. Идея шкал рейтинга заключается в том, чтобы поместить ответ в некоторую точку континуума или в одну из категорий, которым присваивается числовое значение. В графических шкалах ставится крестик на рисунке шкалы, напоминающей линейку. Могут использоваться шкалы без делений или с делениями, с делениями одного или двух типов (как миллиметры и сантиметры на линейке). Концы шкалы и, может быть, крупные деления могут быть обозначены какими-либо высказываниями. Следует избегать экстремистских высказываний для концов шкалы. Таблица 6.1. Распределение факторов, наиболее важных при покупке Фактор, наиболее важный при покупке Процент ответивших Репутация марки 35 – 42% Цена 17 – 20% Особенности (например, аудиосистема с караоке) 12 – 18% Условия гарантии 10 – 14% Характеристики (например, мощность для аудиосистем) 5 – 11% Размеры 2 – 10% В шкалах с категориями отвечающий помечает одну из категорий. Здесь хорошо использование шкалы лиц: от веселого до грустного (?, ?, ?). На возражения о неточности такой шкалы можно ответить контрвопросом: «А насколько точно ставится крестик в семантических шкалах или на шкале с делениями?». Иногда респонденты говорят, что все параметры важны, в других случаях – упрощают проблему, показывая только одну причину. Одним из способов устранения так называемого эффекта гало, когда наблюдается перенос важности от одного суждения к другому, заключается в использовании сравнительных шкал. В сравнительных шкалах предлагается сравнить высказывание о характеристике с несколькими другими. Например, в методе постоянных сумм требуется распределить 200 очков между ответами в зависимости от их важности. Метод требует от респондента некоторых дополнительных усилий, но дает более точные результаты. Надежность шкал рейтинга По данным исследований, приведенных в [23], получены следующие результаты по надежности шкал рейтинга (Табл. 6.2). В этой таблице прямое влияние означает, что чем больше значение параметра, указанного слева, тем больше и надежность. Таблица 6.2. Влияние параметров шкал рейтинга на надежность результатов опроса Параметр шкалы Влияние на надежность Число вопросов Прямое Сложность вопросов Обратное Тип шкалы Нет Количество позиций шкалы Прямое Тип меток Нет Описание позиций шкалы Нет Наличие нейтральной позиции шкалы Прямое при неуверенности в ответах Выбор конкретного типа шкалы измерения определяется целью исследования. Карты восприятия Восприятие товара тесно взаимосвязано с отношением к нему. Чтобы принять меры по повышению прибыльности производства и торговли продуктом, требуется знать: ? количество измерений (размерность пространства характеристик), которые использует покупатель для оценки товара; ? наименование этих измерений; ? место существующего товара в пространстве измерений; ? характеристики идеального товара. Для помощи в решении этих проблем используются карты восприятия. В них похожие товары должны располагаться рядом, а непохожие – на большом расстоянии друг от друга. Типы карт восприятия Один из подходов к решению поставленных проблем основывается на поочередном анализе атрибутов товара. По результатам опросов исследователь выделяет те ключевые свойства, которые характеризуют товар с точки зрения потребителей. Это делается с помощью факторного и дискриминантного анализа. Другой способ – безатрибутный. Респонденты дают только общие суждения об объектах, товарах. У них спрашивают о том, как они воспринимают сходство или различие, каковы их предпочтения. Последний подход получил название многомерного шкалирования . Все типы карт восприятия даны в Табл. 6.3. Таблица 6.3. Типы карт восприятия Тип Метод обработки Безтрибутные Многомерное шкалирование Анализ подобия Анализ различий (предпочтений) Атрибутные Факторный анализ Дискриминантный анализ Многомерное шкалирование Пусть имеются 10 моделей автомобилей, условно обозначенных буквами A…J. Респондентов спрашивают о восприятии их подобия. Опрашиваемому предлагается 45 карточек с парами автомобилей . При этом в инструктаже перед опросом говорится, что атрибуты не важны, важно лишь общее восприятие схожести или различия. Респонденты должны расположить их в ряд от самой схожей пары до самой несхожей. Для простоты вначале можно отсортировать карточки по категориям, например: похожие, не очень похожие, очень не похожие, а затем располагать в ряд карточки внутри каждой категории. Это наиболее простой вариант опроса. Карточки располагаются как показано на Рис. 24, a. Респондент в данном случае считает, что наиболее похожи друг на друга элементы исследования A и С. Чуть менее похожи элементы D и E, еще менее – элементы F и G и т. д. Возможно использование несколько более сложного метода, при котором допускается одинаковая похожесть и «большие» различия в степени похожести (Рис. 24, б). Здесь респондент, расположивший карточки от самой близкой пары до смой несхожей, считает, что F отличается от J так же (в той же степени), как B отличается от D, причем эта похожесть меньше, чем похожесть D и E. Он считает также, что различия между A и B «значительно больше», чем различия между B и E. Рис. 24. Расположение карточек при опросе для многомерного шкалирования Однако при проведении опроса по второму варианту больше времени тратится на инструктаж респондентов. Лучше, если респонденты отвечают в присутствии интервьюера, который может разъяснить им неясные моменты и напомнить о правилах раскладывания карточек. Действия по варианту б) могут возникнуть, когда сам респондент скажет, что на его взгляд расстояние в одной паре такое же, как и расстояние в другой. Анализ проводится по каждому респонденту отдельно. Пары ранжируются. При расположении всех карточек в ряд различия («расстояния») между моделями автомобилей ранжируется числами от 1 до 45. Расстояние между A и С принимается равным 1, что означает наибольшее сходство. Значение 2 приписывается расстоянию между D и E и т. д. Расстояние, равное 45 приписывается наименее похожей паре. При более сложном варианте ответов (Рис. 24, б) расстояние между A и C принимается за 1, между D и E – за 2, между F и J, а также между B и D – за 3, между B и E – за 4, между A и B – за 6, между A и J – за 7 и т. д. В результате получается матрица «расстояний» размерностью 10х10. (Она аналогична таблице расстояний между городами в атласе автодорог). Далее полученная матрица вводится в компьютер и запускается процедура многомерного шкалирования . Компьютеризированная процедура многомерного шкалирования позволяет ответить на вопрос о количестве атрибутов, использованных при ранжировании сходства, а также о взаимном расположении объектов в пространстве этих атрибутов. Вопрос об именах атрибутов в данном методе не рассматривается и должен решаться другими методами. Программа, действие которой основано на результатах работ Шепарда [31], пытается распределить точки, соответствующие объектам, в пространствах различной размерности. Рассмотрим простейший пример с тремя объектами . Пусть это будут три автомобиля. Пусть, далее, автомобиль A самый дорогой, В имеет среднюю цену, C – самый дешевый. Если респондент оценивает их только по одному параметру (цене), то он укажет расстояния AB=1, BC=1, AC=2. Действительно, расстояние между A и C максимально. Точки, соответствующие трем автомобилям, располагаются без искажений на прямой (Рис. 25, а). Если же респондент указал все расстояния равными 1, то это означает, что он имел в виду уже не один параметр. Если, например, автомобили A и B схожи ценой, то автомобили A и C схожи чем-то другим. В одну линию такие точки можно расположить только с искажениями. Программа попытается разместить эти точки с минимальными искажениями расстояний и укажет стресс (общую меру искажения расстояний). В данном случае точки можно без искажений разместить в плоскости (Рис. 25, б). Рис. 25. Расположение объектов при многомерном шкалировании Теперь можно добавить еще один объект (D). Если респондент рассматривал автомобили по двум параметрам, то объект D будет расположен, например, как показано на Рис. 25, в. В этом случае расстояние от A до D будет б?льшим (например, 2). Если же респондент указал все расстояния равными, то для четырех объектов: ? ошибка размещения на прямой (размерность 1) будет велика; ? ошибка размещения в плоскости (размерность 2) будет меньше, но все же значительна; ? ошибка размещения в объеме (размерность 3) будет очень мала (Рис. 25, г). Видно, что при росте размерности появляется больше возможностей для размещения точек. Поэтому для заданного набора расстояний стресс будет уменьшаться с ростом размерности. Идея метода заключается в поиске минимальной размерности, сохраняющей полученные расстояния или дающей малые искажения. Если график зависимости стресса от размерности резко падает до небольшого значения при определенной размерности, то это свидетельствует о наличии определенного количества измерений, которыми руководствовались респонденты. На Рис. 26 этот спад происходит при размерности, равной трем, поэтому для данного случая количество важных измерений равно трем. Наличие небольшого убывающего стресса при больших размерностях обусловлено случайными отклонениями, в первую очередь – достаточно грубым назначением расстояний в виде последовательности целых чисел. Рис. 26. Зависимость стресса от размерности Считается, что стресс, равный 11…20% – плохо, 6…10% – хорошо, 1…5% – отлично, <1% – идеально. Программа также выводит картинку расположения точек – объектов в виде двумерной или трехмерной диаграммы . Расположение осей аналогично расположению факторов: ось X располагается так, что разность проекций на эту ось точек, соответствующих элементам, наибольшая. В результате ось X можно считать самой важной, ось Y – второй по важности, а ось Z – наименее важной. Для определения имен осей (атрибутов) можно пользоваться следующими методами: 1. Респондентов просят описать объекты (для примера – модели автомобилей) с помощью различных атрибутов. Обычно предлагаются интегральные атрибуты, такие, как комфортность, современный стиль, престижность. Исследователь ищет корреляцию между проекциями точек на некоторую ось и полученными при опросе оценками атрибутов. 2. Оси сопоставляются с известными характеристиками, такими как цена, размер, престижность. Если степень совпадения высока, например, по оси X модели автомобилей расположены от дорогой до дешевой, то ось именуется как данная характеристика. 3. Имена координатных осей придумываются на основе предшествующего опыта. Пусть координаты получили название «комфортность» и «экономичность». Если для некоторого автомобиля из карты следует комфортность, но неэкономичность и многие респонденты высказывают аналогичные мнения, то следует обратить внимание на совершенствования двигателя. Интересно ввести в карту идеал. Он вводится из следующих соображений. Все автомобили (теперь уже не пары) ранжируются по предпочтению. Идеал должен быть ближе всего к самому хорошему автомобилю и дальше всего – от самого плохого. Координаты идеала также рассчитывает компьютер . Для того, чтобы успешно применять вышеописанный метод, следует иметь четкий ответ на следующие вопросы. ? Какой продукт, марка исследуется? ? Какие объекты участвуют в сравнении? Например, какие безалкогольные напитки: с сахаром, без сахара, витаминизированные, газированные? ? Как производится суждение о подобии? Помимо сравнения пар можно использовать так называемый фокальный объект, тогда подобие определяется по отношению к нему. ? Как производить агрегирование суждений? Этот вопрос наиболее сложен. Все мнения различны. Усреднение может скрыть важные сегменты рынка. У двух опрашиваемых могут также получиться одинаковые по виду карты, основывающиеся на совершенно разных критериях о подобии. Предложены алгоритмы агрегирования, которые основываются на предположении, что все респонденты используют одинаковые критерии, но с разными весами. Отсутствие атрибутов играет положительную роль, так как иногда респондент не в состоянии объяснить, почему он считает данные элементы исследования похожими или различными. В данном случае это пытается сделать за него исследователь. Однако это очень трудный процесс. В некоторой степени он сродни искусству. Главные проблемы – именование атрибутов и агрегирование суждений, полученных от разных респондентов. Если количество объектов менее 8, то легко переупростить проблему. С другой стороны, при большом количестве объектов от опрашиваемого требуется большой объем работы. Он может сделать ее небрежно, тогда и результат будет сомнительным. В атрибутных методах требуется рассматривать все потенциально важные атрибуты, но чаще сравнение происходит не по отдельным атрибутам, а по некоторой интегрированной оценке. *** Итак, карты восприятия позволяют выявить основные атрибуты, воспринимаемые на рынке, предпочтительные комбинации атрибутов, выделить продукты, которые рассматриваются как аналоги, узнать жизнеспособные сегменты рынка и те характеристики товара, которые позволят ему занять новое место на рынке. Объединенные измерения Часто отношение можно измерить, только если рассматривать несколько атрибутов вместе, в то время как рассмотрение этих атрибутов по отдельности ничего не даст. Описание метода Для примера полезно сравнить такие два товара, как компьютер и кофеварка. Сравнение будет производиться с точки зрения характеристик, определяющих их качество. В компьютере главными потребительскими характеристиками являются быстродействие процессора, объем оперативной памяти для работы, объем диска для хранения программ и данных. Эти характеристики достаточно независимы, так как компьютер специально строится по модульному принципу. Если не хватает оперативной памяти, то ее можно просто докупить. Если мал объем диска, то его можно заменить на более дорогую модель, не затрагивая других важных характеристик. Если же рассмотреть кофеварку, то окажется, что ее важнейшие характеристики (большинство пользователей назовет время закипания, объем и цену) сильно взаимосвязаны. Если требуется увеличить объем, то увеличится и время закипания. Если потребуется ускорить закипание, то потребуется более дорогой нагреватель большей мощности. Именно для случая таких тесно взаимосвязанных характеристик, которые нельзя рассматривать по отдельности, и используется метод объединенных измерений. Пусть кофеварки могут иметь следующие характеристики: цену (800, 1000 и 1200 руб.), емкость (1 чашки, 2 чашек, 5 чашек) и время закипания (1 мин, 3 мин, 5 мин, 10 мин). Очевидно, что предпочтительны экстремальные значения атрибутов: лучшая кофеварка – самая дешевая, самая большая и самая быстрая. Такие атрибуты называются базовыми . При использовании метода объединенных измерений составляются карточки со всеми возможными комбинациями атрибутов (для данного примера их будет 3?3?4=36) . Опрашиваемый должен расположить их по предпочтению (обычно в два этапа, как в предыдущем примере). Самому плохому объекту присваивается одно очко, следующему – два и т.д. Таким образом, чем лучше объект, тем больше он имеет очков. Самая плохая кофеварка будет, скорее всего, иметь цену 800 р., емкость – 1 чашку, время закипания – 10 минут. Выбор варианта, следующего за самым плохим, уже покажет, что важнее для респондента. Если следующий вариант будет дешевле, то цена, скорее всего, будет наименее важным параметром, так как респондент готов поступиться ей в первую очередь, Действительно, более дорогая кофеварка будет почти так же хороша, как и самая лучшая. Полный анализ результатов опроса проводится по следующим шагам. Шаг 1. Варианты комбинаций признаков, записанные на карточках, последовательно нумеруются в соответствии с ответом респондента от 1 (самая плохая комбинация) до числа, равного количеству карточек (для примера – 36) . Шаг 2. Каждому значению каждого атрибута назначается произвольный вес. Для примера общее количество таких весов – 3+3+4=10. Удобно начать с единичных значений всех весов. Шаг 3. Рассчитываются веса всех комбинаций как сумма весов атрибутов. Например, для самой плохой кофеварки суммарный вес будет равен (вес цены 800 р.) + (вес времени 10 минут) + (вес емкости 1 чашка) = 1+1+1 = 3. Вначале веса всех комбинаций будут равны 3. Шаг 4. Значения выбранных весов атрибутов изменяются до тех пор, пока не будет достигнуто наилучшее совпадение веса каждого варианта и присвоенного ему номера. Иными словами, цель поиска итоговых весов атрибутов – добиться того, чтобы у самой плохой кофеварки суммарный вес был бы равен 1, у следующей – 2 и т.д., а у самой хорошей – 36. Тогда веса «хороших» значений атрибутов будут велики. Такую процедуру можно реализовать в Excel. Ставится оптимизационная задача: найти минимальное значение суммы квадратов (или абсолютных значений) отклонений сумм весов от номеров вариантов по всем вариантам при изменении весов атрибутов. Результат может несколько отличаться от идеально прямой линии. Начальная ситуация и идеальное решение представлены на Рис. 27, а. Рис. 27. Иллюстрация метода объединенных измерений Шаг 5. Строятся графики полученных весов: по оси абсцисс – значение атрибута, по оси ординат – вес. Построенные в одном масштабе, они могут рассказать о том, как воспринимаются атрибуты (Рис. 27, б). Тот атрибут, который имеет наибольшую разницу значений весов, является наиболее важным . В данном случае это время закипания. Иногда график имеет четко выраженный излом. Например, для цены он может идти горизонтально, а затем иметь резкий спад. Это говорит о наличии границы эластичности спроса. Бывает, что максимум графика приходится на среднее значение, тогда оно является наиболее предпочтительным. По графикам можно определить, какими характеристиками должен обладать вновь разрабатываемый прибор. Для данного случая следует разрабатывать быструю кофеварку средней емкости по средней цене, так как время закипания – важнейший параметр и респондент считает наилучшим минимальное время. Средняя и низкая цена воспринимаются почти одинаково, но более высокая цена даст большую прибыль. Наилучшая емкость – средняя. Если же производство такой «идеально» кофеварки технически сложно, то можно либо увеличить время закипания, так как разница весов для времени закипания в одну и три минуты мала, либо снизить емкость по той же причине. Некоторую дополнительную информацию можно получить из графика Рис. 27, а. Если он совпадает с идеальным, то для респондента связи между критериями нет. Например, из трех атрибутов он считает один значительно более важным, чем другие, второй – значительно более важным, чем третий. Поэтому при сортировке карточек он, в частности, разделил все предложенные образцы на хорошие, средние и плохие по одному критерию. Для него не существует возможности скомпенсировать не очень удачное значение важного атрибута комбинацией значений менее важных. Если же график сильно отличается от идеального, имеет большие колебания (иногда даже нельзя сказать, что лучшим образцам соответствуют бoльшие веса), то респондент, скорее всего, просто запутался в ответах и его результатам нельзя придавать большое значение . Данный метод, как и метод многомерного шкалирования, анализирует мнение одного человека. Группировка респондентов по результатам измерений дает основу для сегментирования. Можно объединить в один сегмент ценовых покупателей, а затем разбить их на подсегменты по предпочтительной цене. Но более полезно сегментировать опрошенных по их представлению об идеальном товаре. Можно объединить опрошенных в один сегмент, если они признают «достаточно хорошей» определенную модификацию товара. Такое сегментирование отвечает на важный вопрос о том, сколько модификаций товара следует выпускать. Проблемы применения метода 1. Выбор атрибутов. Они должны быть важными, влияющими на выбор товара, и в то же время должна иметься возможность управлять ими при разработке новых товаров. 2. Определение количества уровней атрибутов. Их не должно быть слишком много, чтобы не затруднять респондента. В то же время сложная форма результирующих кривых будет видна только из нескольких значений. 3. Задание значений атрибутов. Они должны быть реальными, чтобы к опросу отнеслись серьезно (где это видано: суперкофеварка за 100 р.?). 4. Декомпозиция. При большом количестве комбинаций можно предположить ортогональность атрибутов, что снижает размерность задачи. Например, для рассмотренного примера можно рассмотреть компромиссную двумерную таблицу время – цена. Можно пользоваться и полным набором двумерных таблиц. Но тогда возникает опасность упустить важные взаимосвязи. 5. Использование компьютера. Он выводит на экран пару карточек с вариантами и спрашивает, какой из вариантов лучше. Можно проверить состоятельность ответов. Сразу проводятся расчеты и вывод результатов. Компьютер может проконтролировать и непротиворечивость ответов . 6. Выбор формы представления вопросов и природы суждений. Можно предъявлять для сортировки карточки со словесным описанием, разбить опрос на параграфы (1 параграф – 1 вопрос), либо предъявлять наглядные картинки и даже образцы. 7. Агрегирование суждений. Метод основан на анализе индивидуального мнения. Усреднение снизит ценность проделанной работы. Компромисс – группировка ответов, в частности, с применением кластерного анализа. Можно попробовать сравнить полученные результаты с характеристиками существующих сегментов. 8. Добросовестность ответов. Следует решить, что делать с небрежными ответами. Обычно проверяют, как сказывается их учет или неучет на результаты исследований. В отчете следует привести выводы по этому вопросу. Измерения психологических атрибутов Когда требуется исследовать, почему читают ту или иную газету, почему неохотно заключают договоры страхования и т. п., используется измерение психологических атрибутов. К их числу относятся вкусы, предпочтения, образ мыслей, тип личности, индивидуальность. Существуют определенные гипотезы – модели взаимосвязи психологических атрибутов. В составе таких гипотез имеются концептуальные определения (понятия склонность к риску, уверенность в себе, коммуникабельность, удовлетворенность работой) и определения связей между этими понятиями (если человек коммуникабелен, то он, скорее всего, доволен своей работой ) Определения связей имеют характер допущений типа законов. Не все эти определения можно проверить на практике, поэтому вводятся дополнительные, проверяемые, понятия и дополнительные связи между этими проверяемыми понятиями и концептуальными определениями, то есть связи между конструкциями и наблюдениями. Таким образом, для проверки гипотезы измеряются величины атрибутов, которые поддаются измерению, после чего анализируется, соответствуют ли эти значения теоретическим зависимостям. Хотя такой способ не всегда дает полную уверенность в правильности гипотезы, все же он позволяет повысить эту уверенность. В настоящее время не существует универсальных или хотя бы общепризнанных теорий о взаимосвязи психологических атрибутов. Поэтому важно освоить инструмент их разработки и проверки. Структура гипотезы о связи психологических атрибутов и поведения Типовое представление гипотезы – сеть. В сети имеются узлы и связи между ними. В целом теория находится «над» наблюдениями и присоединяется к ним правилами интерпретации. Они связывают теорию с наблюдениями. Предлагается следующая система обозначений. Круг – теоретические конструкции. Треугольник – наблюдаемые переменные. Прямоугольник – эмпирические концепции. Сплошная линия – гипотеза. Пунктир – правила соответствия. Волнистая линия – рабочее определение. Пример гипотезы о поведении покупателя при покупке дан на Рис. 28. Рис. 28. Теория о поведении покупателя при покупке Теория основывается на следующих основных терминологических определениях. ? Все ментальные события и действия, имеющие покупку как результат, являются поведением. ? Все намерения покупки являются ментальными событиями. Все вопросы о товаре и действительные покупки являются действиями. ? Отсюда все намерения, вопросы о товаре и действительные покупки являются поведением. Гипотеза заключается в том, что с поведением при покупке связаны ожидания от обладания товаром и значимость покупки. Все эти концепции не могут быть проверены непосредственно. Значения связей пунктирных линий от треугольника к квадрату становится ясным из примера. Так, жирная пунктирная линия означает: Если у респондента Y попросить записать, сколько раз он спрашивал о товаре за последнюю неделю, то ответ будет z. Значение жирной волнистой линии: Наблюдатель записывает, купил ли покупатель товар и в каком количестве. Остальные связи предполагаются линейными. В общем случае каждая конструкция состоит из нескольких параметров. Например, ожидания складываются из степени удовлетворения определенной потребности, оценки удобства эксплуатации товара, его долговечности и т. д. Каждый из этих параметров влияет на каждый компонент действительной покупки (количество, периодичность, цена и т. д.). Ожидания имеют такие компоненты, как престижность владения товаром, снижение времени и повышение удобства выполнения определенной работы Например, при покупке стирального порошка улучшается процесс стирки. Таким образом, каждая связь описывается системой уравнений. Вот пример одного из таких уравнений. Количество купленного товара = a + b * Степень удовлетворения потребности + с * Оценка удобства эксплуатации + d * Оценка долговечности + e * Престижность владения товаром + f * Степень снижения времени выполнения работы + g * Степень повышения удобства выполнения работы. Здесь в левой части содержится один из компонентов поведения при покупке. Видно, что наиболее удобно использовать для таких уравнений матричную форму. Система уравнений, описывающих модель, называется структурными уравнениями. Обычно она линейна. Линейная модель проста, часто встречается в экономике, полезна в качестве первого шага анализа, часто достаточна, так как информация не очень достоверна. Рис. 28 еще недостаточен для гипотезы. Требуется узнать силу связей и проверить, насколько эта гипотеза соответствует собранным данным. Все это можно определить по результатам опросов и наблюдений. В пятой версии программы Statistica for Windows имеются средства для анализа таких моделей. После того, как структура модели, построенной исследователем, введена в компьютер с помощью специального языка, и введены результаты опросов и наблюдений всех наблюдаемых переменных, программа автоматически пытается найти такие значения коэффициентов модели (силу связей), которые обеспечат максимальное согласие данных измерения и гипотезы. В конце этого процесса выводятся все коэффициенты модели и ряд показателей оценки ее качества. Структурные уравнения и причинно-следственные диаграммы В пятой версии пакета Statistica for Windows взаимосвязь концепций описывается на языке Path1, и по результатам тестирования производится проверка их состоятельности. Это довольно сложная задача статистического анализа. Если оказывается, что теория не подтверждается, то приходится разрабатывать новую теорию (с новыми концепциями и связями между ними) и заново ее проверять. В системе помощи пакета имеются несколько удачных примеров применения данного метода. Если построена хорошая модель, то по ней можно спланировать влияние на внутренние переменные, что изменит реакцию потребителя. Например, если выяснится, что главным фактором при покупке является имидж компании-производителя, то при планировании рекламных мероприятий следует уделить основное внимание его поддержанию или улучшению. Построение диаграммы, подобной Рис. 28, и соответствующей ей системы уравнений – довольно сложный процесс, поэтому здесь будет рассмотрен только простейший пример. Обычно подразумевается, что Х – независимая переменная (причина), Y – зависимая (следствие). Гипотеза гласит, что Y есть функция от переменной Х. Простейшая линейная зависимость имеет вид Y=bX. В более сложном случае Y может существовать и без X: Y=a+bX. В маркетинговых процессах часть имеется случайная составляющая ?: Y=a+bX+?. Такой вид имеет, в частности, уравнение простейшей линейной регрессии. Для ввода такой модели в виде причинно-следственной диаграммы в программе Statistica используются следующие понятия. Явные переменные, измеряемые непосредственно . В примере это X и Y. Они обозначаются прямоугольниками. Скрытые переменные – гипотетические . Обозначаются овалом, окружностью, скругленным прямоугольником. Для примера это ?. Эндогенные (внутренние) переменные . Они априорно неизвестны, программа пытается определить их характеристики. Это ?. Экзогенные (внешние) переменные . Надо знать их дисперсию и ковариацию. Это X и Y. Всего возможно 4 типа переменных (явные эндогенные и т. д.). Каждая переменная должна иметь хотя бы одну связь (не должно быть переменных, не связанных с другими). Могут быть связи от одной переменной к нескольким, когда одна переменная влияет на многие. Могут быть связи от одной переменной к другой прямо или через промежуточные узлы. Тогда эффект некоторой переменной может компенсироваться. Могут существовать связи между измеряемыми переменными. Могут быть обратные связи (замкнутые контуры). Для записи используются специальные обозначения. Явные переменные обозначаются прямоугольником. Скрытые переменные – скругленным прямоугольником или кругом. Связь – стрелкой. Дисперсии и ковариации обозначаются дугами. Номера параметров помещаются около стрелок или дуг. Если номер один и тот же, например, у двух стрелок, то подразумевается, что эти две связи должны иметь одинаковое значение. Значения параметров-констант имеют десятичную точку. Экзогенные переменные должны иметь дисперсии (и, по необходимости, ковариации). Если они известны, то они вводятся как значения, если нет – определяются программой. По умолчанию для скрытых экзогенных переменных дисперсии равны единице, ковариации – нулю. Пример. Модель для линейной регрессии Y=bX+? выглядит, как показано на Рис. 29. Рис. 29. Структурная диаграмма линейной регрессии Рисунок показывает, что мы наблюдаем X и Y. Они связаны почти линейно, но есть какая-то помеха. Требуется узнать, силу линейной связи и величину помехи. Для анализа требуется ввести данную модель в программу на языке PATH1. В программе Statistica для этого имеется конструктор путей. Далее можно выбрать один из методов поиска решения и запустить его. Результаты представляют собой сообщение о том, что процесс сошелся, и оценки качества модели. Сущность проверки качества заключается в следующем. Имеется набор данных о наблюдаемых переменных. Для них можно построить корреляционную матрицу (для примера это будет просто корреляция между X и Y. Далее строится такая же корреляционная матрица, но уже на основании параметров модели. Для оценки их совпадения можно использовать, в частности, критерий ?2. Программа вычисляет большое количество различных индексов, используемых для оценки различных аспектов качества полученной модели. Например, адекватность модели можно оценить с помощью параметра Root Mean Square Standard Residual. Если он меньше 0,05, то подгонка хорошая, если больше 0,1 – модель неадекватна. Более подробное описание характеристик качества модели можно найти в системе помощи программы. Далее имеется возможность провести дополнительный анализ, например, выделить то, что не объясняется моделью или использовать полученную модель для имитационных экспериментов. Если модель оказалась плохой, то требуется исследовать ее валидность по отношению к конструкциям. Исследуется шесть компонентов. 1. Теоретический смысл концепций. Концепция – базовая единица мышления. Она представляет мысленную конструкцию или образ объекта, вещи, идеи, явления (мир мысли). Достигает смысла через отношения с терминами (мир языка) и объектами (мир опыта). 2. Смысл наблюдаемой части. Зависит от философской школы. Наиболее часто исследователи придерживаются следующих школ: а) бихевиоризм. Считается, что объект исследования имеет некоторое теоретическое свойство, если и только если определенные тестовые условия приводят к определенному результату. Другие школы считают этот подход достаточно ограниченным, так как фактически он сводится к изучению только функциональных зависимостей, отрицая причинно-следственные связи. Однако часто для простых описательных исследований и не требуется ничего большего. б) позитивизм. Используется частично интерпретационная модель. При работе в заданных тестовых условиях объект исследования будет иметь определенное теоретическое свойство, если и только если получается заданный результат. Здесь связь между концепцией и наблюдением логическая, но определяется условиями теста. В частности, отношение определяется как результат опроса с использованием шкалы Турстоуна. Отношение, измеренное по шкале Ликерта – другое понятие. Подход также применим в некоторых частных случаях. в) диалектический материализм. Если объект исследования обладает определенным свойством, то определенный тест будет давать определенный результат. Исследования проводятся по следующему принципу. Допускается (постулируется) наличие у объекта исследования определенного свойства. Из этого делается вывод, какими должны быть результаты измерения. Если выводы подтверждаются, то, возможно, объект действительно обладает данным свойством. Последний подход наиболее плодотворен. 3. Состоятельность способов наблюдения. Ниже этот вопрос будет рассмотрен более подробно. 4. Совпадение результатов, полученных различными методами. 5. Смысловое отличие каждой используемой концепции от других. 6. Предсказательная валидность (качество прогнозов). В целях улучшения модели можно попробовать ввести дополнительные связи, дополнительные наблюдения (что достаточно проблематично), дополнительные переменные, рассмотреть другую гипотезу. Проектирование тестов Итак, тесты обычно являются частью исследования, связанного с некоторой психологической гипотезой. Для их проектирования существуют специальные методы. Обратимся к примеру разработки теста для контроля грамотности. Вообще-то, для проверки грамотности требуется проверить испытуемого по всем словам, но это очень долго и дорого. Поэтому возникает задача выбора не очень большого, но достаточного числа хороших образцов слов. Для отбора образцов слов или, шире, вопросов теста, применяется следующая последовательность действий. Шаг 1. Четко определяется, чтo подлежит измерению, чтo является характеристикой (в примере – грамотность), а что – нет (знание специальных отраслей науки). Определяются наблюдаемые характеристики, отражающие некоторую представляющую интерес концепцию. Например, для определения удовлетворенности электронагревателем берутся цена, срок службы, качество, эстетичность, помощь продавца при покупке, отношение членов семьи. Шаг 2. На основе обзора литературы, обзора опыта, работы фокусных групп, то есть методами поисковых исследований генерируется набор из достаточно большого количества (порядка 100) вопросов, позиций, определяющих характеристику с различных сторон (в примере – контрольные слова). Предполагается, что каждый вопрос имеет количественный ответ, а общий результат получается как сумма ответов по каждому вопросу . Шаг 3. Вопросы предварительно проверяются. Явно плохие сразу же отбрасываются. Например, при контроле грамотности не следует предлагать при опросе узкоспециальные термины. Бесполезно включать в тест грамотности и слишком простые слова. Однако число оставшихся вопросов все равно велико. Поэтому требуется использовать специальные методы для отбора только сравнительно небольшого числа наилучших вопросов. Шаг 4. Собираются данные от определенной выборки. Выборка может производиться, например, среди учащихся тех школ, где будет использоваться тест грамотности. Для случая с электронагревателем опрашивают тех, кто купил его за последние два-три года. Используется личное интервью или опрос с приглашением респондентов в лабораторию. Респонденты обычно получают небольшое вознаграждение. Шаг 5. Для окончательного выбора на основе полученных данных используется так называемая модель доменов. Окончательный отбор вопросов основывается на том, что определенному числу респондентов предлагают тест, который содержит все предварительно отобранные вопросы. По полученным ответам производится окончательный отбор хороших вопросов. Анализ эквивалентности здесь недостаточен, так как он позволяет оценить только весь набор вопросов, но не выбрать лучшие. Основное допущение, на котором строится процесс отбора, заключается в том, что сумма ответов по большому числу вопросов и есть истина. Хотя на самом деле истина – сумма ответов на все возможные вопросы (грамотное написание всех возможных слов), а реально имеется только выборка из них (большое количество более или менее удачных слов для проверки грамотности), при большом числе вопросов результат будет достаточно близок к истине. Второе допущение заключается в том, что не существует ни одного вопроса, который полностью определил бы исследуемую характеристику (грамотность нельзя проверить по одному слову). Иначе достаточно было бы задать этот единственный вопрос. Каждый вопрос рассматривает исследуемую психологическую характеристику под некоторым особым углом зрения, касается различных аспектов общей концепции (грамотный человек должен правильно писать слова с безударными гласными, с суффиксами и т. д.). Цель процедуры отбора – определить соответствие каждого вопроса истине (какие слова лучше взять для окончательного варианта теста). Пусть требуется сконструировать анкету об отношении (предрассудках) к зарубежным машинам . Есть гипотеза (концепция), что такие предрассудки существуют. Пусть имеется ряд предварительно отфильтрованных высказываний: У них нет индивидуальности? Все выглядят на одно лицо? Красные иномарки особенно безобразны? … Респонденты (пробная группа) обозначают каждое утверждение цифрами от 1 (полностью не согласен) до 9 (полностью согласен). Очевидно, что чем больше суммарная оценка ответов респондента, тем больше сила его предрассудков. Каждое из утверждений отражает проверяемую концепцию в большей или меньшей степени. Например, третье утверждение скорее всего отражает восприятие цвета, а не предрассудок, и, скорее всего, не подходит. Считается, что Xо=Xt+Xr, то есть результаты опроса Xo слагаются из измерения предрассудка плюс случайная составляющая . Если принятое допущение верно, то увеличение количества пунктов повышает долю истинной компоненты. Чем больше пунктов, тем выше надежность теста. Надежность можно количественно оценить как надежность = , то есть как долю различия мнений в общих различиях, включающих и ошибки тестирования. Если взять сумму результатов многих более или менее надежных пунктов, охватывающих разные аспекты проблемы, то случайная составляющая различных ответов компенсируется, и можно считать, что математическое ожидание ошибки будет равно нулю для суммы ответов. Поэтому сумма ответов и принимается за истину. Так как в опросе участвовало несколько человек, то можно вычислить дисперсию их ответов на каждый вопрос и дисперсию суммы баллов каждого участника опроса. Дисперсия суммы будет меньше суммы дисперсий по вопросам, если вопросы касаются какой-то одной концепции, то есть между ответами существует положительная корреляция. При проектировании тестов могут появиться вопросы, имеющие отрицательную корреляцию с суммарным результатом . Они сильно влияют на суммарные результаты. Если их достаточно много, то возникают сомнения в истинности суммарной оценки по всем ответам. Что делать с такими вопросами? Если отрицательная корреляция мала, то эти вопросы следует убрать. Если она велика, то можно использовать инвертирование ответов (как в шкале Ликерта). После того, как устранены или преобразованы вопросы с большой отрицательной корреляцией, для опроса из k пунктов, в котором участвовало n человек, вычисляется показатель , где ? – коэффициент надежности Кронбаха, Di – дисперсия ответов на i-й вопрос, Dt – дисперсия сумм результатов теста всех участников. Если действуют только случайные факторы, то дисперсия суммы равна сумме дисперсий и ?=0. Если же тест совсем не содержит случайной составляющей, то все ответы идентичны и ?=1. Если ? мала, то требуется либо добавить новые вопросы, либо убрать неудачные. Программная система Statistica for Windows вычисляет корреляцию ответов на каждый вопрос с суммарным результатом. Кроме того, вычисляется ? всего теста, а главное – для каждого вопроса выводится то значение ?, которое будет иметь тест, если из него изъять данный пункт. Таким образом, отбор вопросов следует осуществлять либо по корреляции (убирать те пункты, которые имеют малую корреляцию с суммарным результатом), либо по ? (удалять те вопросы, при изъятии которых ? увеличивается). Этот процесс можно повторить несколько раз до тех пор, пока изъятие любого оставшегося вопроса не будет ухудшать надежность теста. После корректировки теста образуется домен – набор вопросов, которые освещают одну и ту же проблему. Правда, возникает вопрос, какую же проблему они освещают. Ответ на него может дать только анализ валидности. Валидность должна проверяться всеми доступными способами. Если существует корреляция между результатами теста на наличие предрассудков к иномаркам и уровнем покупок иномарок, значит, наша уверенность в том, что тест проясняет отношение к иномаркам, повышается. Реально проверка валидности тестов – длительная процедура. Например, валидность теста профпригодности может быть проверена только через несколько лет по успехам принятых на работу с предварительным тестированием . *** Большой интерес представляет также анализ уже разработанных тестов с использованием модели доменов .
Каталог работ |